Ceph存储方案规划

Ceph存储集群分为超融合集合及分离集群,本章分别介绍超融合部署和分离式部署场景下的硬件选型和网络规划。

超融合部署

融合部署是将计算、存储、网络和虚拟化资源整合在一台服务器中的部署方案,此方案不需要额外购置存储设备。只需要节点有足够的硬盘存储等设备即可使用,多用于3节点以及较少节点(少于10台)的部署。

CPU选型

  • 不同型号的CPU建议放置在不同的集群,避免因指令集不同造成的操作影响,如云主机迁移失败。
  • 高性能业务场景建议采用高主频CPU,常规业务场景可采购常见CPU型号。目前市面CPU常见频率为1.86GHz、2.2GHZ、2.3GHz,CPU核数常见为40、48、64等核数,线程常见 为96、128、144、160等线程数。
  • 采用ZStack企业分布式存储且为存储节点与计算节点分离的场景中,CPU选型推荐:双路 Intel Xeon Silver 4114 及性能更加强大的CPU。
  • 采用ZStack企业分布式存储超融合场景中,需要考虑每个OSD 1个CPU内核线程的损耗,因此需要在常规CPU中考虑企业存储所占用的CPU资源,针对ZStack Cloud云平台的CPU超分建议1-4倍,同时建议在云主机CPU性能要求高的场景可开启host-passthrough,提供和硬件CPU相同的处理能力。

内存选型

  • 内存选型需根据实际业务云主机规格进行计算。
    • 例如4c8G规格大小的云主机数量内存总和即为所需要的物理内存之和。
    • 常规情况下,单台物理机上运行10台云主机。
  • 目前市面中常见云主机常规规格为4C4G、4C8G等配置进行计算和规划,如果有其他规格可根据实际进行计算。
  • 同时在内存容量规划上还需要进行系统层面的保留。
    • 针对操作系统保留10G内存,防止发生OOM导致系统异常。
    • 针对ZStack Cloud云平台管理节点程序内存保留15G。
    • 针对采用ZStack企业分布式存储的超融合架构,单个OSD需保留5G内存,即OSD*5=保留容量。
    • 目前ZStack Cloud云平台中,单台物理机常见内存容量为128G-256G、256G-512G区间。

硬盘选型

  • 在ZStack Cloud云平台最佳实践中,任何存储方式中系统盘均推荐使用SSD,因为SSD能够提供较高的IOPS和带宽,且管理节点均采用数据库以及各软件提供服务,选择性能较好的SSD能够提供更好的使用体验。
  • ZStack企业分布式存储中SSD和HDD,需针对不同方案进行分别配比,生产环境比例为1:5,即1块 SSD对应5块HDD,机械硬盘选购时需考虑尺寸和容量,同时需关注硬件的IOPS和带宽。
  • 在ZStack企业分布式存储中,同一个存储池中需配置相同型号和规格的磁盘,若采用不同规格和型号的磁盘,将造成木桶效应,整体性能以最低性能为准。
  • 同时规划ZStack企业分布式存储中需折算为三副本后的有效容量,且生产环境必须三副本,禁止使用两副本。
  • 在采购SSD作为缓存盘时,必须确保DWPD大于3,避免SSD频繁故障,采用市面常见SSD作为系统盘,大小推荐400-600G。

网络规划

  • 管理网络:推荐采用双千兆,管理节点要采用双万兆,主要用于管理云平台相关的硬件资源。
  • 业务网络;推荐采用双万兆,主要用于云平台上云主机的业务网络,对外提供应用服务。
  • 存储网络:推荐采用双万兆,用于连接共享存储指定的存储网络,可使用此存储网络来判断云主机健康状态; 建议提前规划单独的存储网络,避免潜在风险。
  • 分布式存储网络
    • 管理网络(AdminNetwork):使用此网络来管理存储集群,提供GUI、API等管理功能,一般与ZStack Cloud云平台的管理网络共用。
    • 存储集群对外网络(PublicNetwork):提供RBD客户端访问的网络,提供CephMonIP的网络,ZStack Cloud云平台计算节点使用此网络进行qemurbd的连接,对应ZStack Cloud云平台的存储网络。
    • 存储集群内部网络(ClusterNetwork):存储集群内部互通的网络,一般为万兆网络,可以复用存储集群对外网络,如果对网络性能要求高,也可以单独部署 。
    • 存储网关网络(GatewayNetwork):表示访问ISCSI,对象存储等使用,ZStack Cloud云平台暂未使用,建议复用存储集群对外网络。

分离式部署

分离部署相对较为复杂,是将计算节点,管理节点以及存储节点分离的部署方案,此方案需要购置专门的服务器或存储设备作为存储节点。多用于大集群(大于等于10台)的部署。本章节以10节点集群为例进行说明。

CPU选型

  • 不同型号的CPU建议放置在不同的集群,避免因指令集不同造成的操作影响,如云主机迁移失败。
  • 高性能业务场景建议采用高主频CPU,常规业务场景可采购常见CPU型号。目前市面CPU常见频率为1.86GHz、2.2GHZ、2.3GHz,CPU核数常见为40、48、64等核数,线程常见 为96、128、144、160等线程数。
  • 采用ZStack企业分布式存储且为存储节点与计算节点分离的场景中,在CPU选型上推荐:双路 Intel Xeon Silver 4114 及性能更加强大的CPU。
  • ZStack企业分布式存储超融合场景,需要考虑每个OSD 1个CPU内核线程的损耗,因此需要在常规CPU中考虑企业存储所占用的CPU资源,针对ZStack Cloud云平台的CPU超分建议1-4倍,同时建议在云主机CPU性能要求高的场景可开启host-passthrough提供和硬件CPU相同的处理能力。

内存选型

  • 内存选型需根据实际业务云主机规格进行计算。
    • 例如4c8G规格大小的云主机数量内存总和即为所需要的物理内存之和。
    • 在单台物理机上云主机数量,常规为单台物理机上运行10台云主机。
  • 目前市面中常见云主机常规规格为4C4G、4C8G等配置进行计算和规划,如果有其他规格可根据实际进行计算。
  • 同时在内存容量规划上还需要进行系统层面的保留。
    • 针对操作系统保留10G内存,防止发生OOM导致系统异常。
    • 针对ZStack Cloud云平台管理节点程序内存保留15G。
    • 针对采用ZStack企业分布式存储超融合架构,单个OSD需保留5G内存,即OSD*5=保留容量。
    • 目前ZStack Cloud云平台中常见对于内存常见单台物理机内存容量为128G-256、256G-512G区间。

硬盘选型

  • 在ZStack Cloud云平台最佳实践中,任何存储方式中系统盘均推荐使用SSD,因SSD能够提供较高的IOPS和带宽,且管理节点均采用数据库以及各软件提供服务,因此选择性能更好的SSD能够提供更好的使用体验。

  • 使用ZStack企业分布式存储中SSD和HDD,针对不同方案进行分别配比,生产环境比例为1:5,即1块 SSD对应5块HDD,机械硬盘选购时需考虑尺寸和容量,同时需关注硬件的IOPS和带宽。

  • 在ZStack企业分布式存储中,同一个存储池中需配置相同型号和规格的磁盘,若采用不同规格和型号的磁盘,将造成木桶效应,整体性能以最低性能为准。
  • 同时规划ZStack企业分布式存储中需折算为三副本后的有效容量,且生产环境必须三副本,禁止使用两副本。
  • 在采购SSD作为缓存盘时,必须确保DWPD大于3,避免SSD频繁故障,采用市面常见SSD作为系统盘,大小推荐400-600G。

网络规划

  • 管理网络:推荐采用双千兆,管理节点要采用双万兆,主要用于管理云平台相关的硬件资源。
  • 业务网络:推荐采用双万兆,主要用于云平台上云主机的业务网络,对外提供应用服务。
  • 存储网络:推荐采用双万兆,用于连接共享存储指定的存储网络,可使用此存储网络来判断云主机健康状态; 建议提前规划单独的存储网络,避免潜在风险。
  • 分布式存储网络
    • 管理网络(AdminNetwork):使用此网络来管理存储集群,提供GUI、API等管理功能,一般与ZStack Cloud云平台的管理网络共用。
    • 存储集群对外网络(PublicNetwork):提供RBD客户端访问的网络,提供CephMonIP的网络,ZStack Cloud云平台计算节点使用此网络进行qemurbd的连接,对应ZStack Cloud云平台的存储网络。
    • 存储集群内部网络(ClusterNetwork):存储集群内部互通的网络,一般为万兆网络,可以复用存储集群对外网络,如果对网络性能要求高,也可以单独部署 。
    • 存储网关网络(GatewayNetwork):表示访问ISCSI,对象存储等使用,ZStack Cloud云平台暂未使用,建议复用存储集群对外网络。

results matching ""

    No results matching ""